Noviembre 2018

Cómo es la iniciación a R en la mayoría de los casos

¿Qué es R?

  • R es un lenguaje de programación orientado a la realización de procesos estadísticos y gráficos.
  • Arrancó en los años 1993/96 y fue creado por Ross Ihaka and Robert Gentleman (Auckland University, Nueva Zelanda), basándose en el lenguaje S (1976).
  • A diferencia de S, R es un software de código abierto ("open source"). Es gratuito!

Filosofía de R: "hibridez"

  • R propone satisfacer dos modalidades de trabajo muy frecuentes para los analistas de datos:

    • Con una interfaz interactiva, con línea de comandos: se dispone de una consola, donde se tipea un comando, se da enter y algo sucede. Voy viendo y haciendo.

    • Como lenguaje de programación: para tareas más complejas, escribimos un programa (o "script") y lo ejecutamos en un servidor o desde la terminal de la compu. No se trabaja comando por comando.

  • R es un híbrido entre estas dos modalidades.

Filosofía de R: "Software Libre"

  • R se distribuye bajo la licencia para software GNU GPLv2 que establece las siguientes libertades:

    • Libertad de usar el programa con cualquier propósito.
    • Libertad de ver cómo fue hecho, cómo funciona y modificarlo.
    • Libertad de distribuir copias.
    • Libertad de publicar modificaciones y agregados para que estén disponibles para la comunidad.

Filosofía de R: "Comunidad"

  • R tiene una comunidad de usuarios muy activa, de las más diversas áreas (es interdisciplinario).
  • Probablemente, casi todo lo que quieras hacer, alguien más ya lo pensó, lo hizo y dejó un hermoso tutorial por ahí para que vos también lo puedas hacer (es extensible).
  • Cualquier mensaje de error que te aparezca, lo googleas y seguro hay muchas páginas con gente debatiendo cómo solucionarlo (es comunitario).
  • Existen miles de páginas, blogs y foros de ayuda en internet (por ejemplo, StackOverflow).

Otras características de R

  • Se integra con otras herramientas (como Latex) para generar manuscritos y presentaciones que pueden actualizarse automáticamente.
  • Disponible en cualquier plataforma de sistema (Windows, OS X, Linux).
  • Provee herramientas gráficas para generar figuras de excelente calidad listas para publicación.
  • Podemos trabajar con múltiples fuentes de datos: Excel, CSV, texto plano, bases de datos, y mucho mas …

Diseño del sistema R

Se divide en dos partes:

  • La base ("base R System"): se descarga desde CRAN ("Comprehensive R Archive Network"). Funciones básicas y fundamentales de R.

Diseño del sistema R

  • El resto: incluye miles de paquetes con funcionalidad específica que el usuario puede elegir descargar también desde CRAN u otros lugares.

Hay más de 12500 paquetes regristrados y aprobados en CRAN

Ok!… ¿Pero qué cosas puedo hacer en R?

Análisis estadísticos

Hermosos gráficos!!

Documentos para presentaciones e informes

Hay mas!!

  • Gráficos interactivos
  • Libros y publicaciones online
  • Aplicaciones para páginas web
  • Material para dar clases
  • Etc., etc., etc., …

¿Qué es Rstudio?

  • RStudio es un entorno de desarrollo integrado (IDE) para R.
  • Un entorno de desarrollo integrado es una aplicación informática que proporciona servicios integrales para facilitarle al programador el desarrollo de software.

¿Por qué usar RStudio?

  • permite abrir y editar varios archivos a la vez
  • incluye autocompletado y resaltador de código
  • permite ejecutar porciones de código con sólo seleccionarlos en el programa
  • muestra el workspace (todos los elementos que hemos creado con nuestro programa)
  • muestra el historial de sentencias ejecutadas
  • integra ayuda y documentación
  • integra la gestión de paquetes adicionales
  • gestiona proyectos de trabajo
  • gestiona gráficos

y mucho más!

Conociendo a RStudio

  • Cuando se abre RStudio por primera vez se pueden visualizar tres paneles:
Captura de pantalla de RStudio

Captura de pantalla de RStudio

Conociendo a RStudio

  • La consola. Es la ventana que se comunica con el motor de R.
  • Arriba a la derecha, el panel con las pestañas:

    • Environment (ambiente): muestra todas las cosas (objetos) que R tiene en la cabeza (memoria), como conjuntos de datos, modelos, resultados, etc.
    • History (historial): lista todas las instrucciones que R ha corrido.
  • Abajo a la derecha: panel con las pestañas Files, Plots, Packages, Help y Viewer. Tienen lo que sus nombres indican!

Cosas que yo también hubiese querido saber cuando empecé a usar R

  • Usar RStudio
  • Usar Knitr
  • Organizar mi análisis (limpieza de datos, visualización, análisis)
  • Usar control de versiones
  • Preguntar dando un ejemplo reproducible
  • Usar tidyverse

S.O.S. en R

S.O.S. en R

¡Muchas gracias!

Agradecemos a los chicos de R en Rosario por pasarnos el material para esta presentación